这一个Tab键,我愿意单独付费:Cursor在线强化学习优化代码建议 基于此,Cursor 采用在线强化学习技术训练出一个全新的 Tab 模型。该模型将每一次用户交互(接受/拒绝建议)都视为一个强化信号,直接用于模型的在线优化。在每天超过 4 亿次请求的巨大流量驱动下,模型得以进行高频度的、基于真实世界反馈的持续学习。 代码 学习 cursor tab cursor在线 2025-09-15 10:35 2